可以将相当多的现实问题提出为决策问题,其中必须反复从一组替代方案中做出适当的选择。多次专家判断,无论是人为的还是人为的,都可以帮助做出正确的决定,尤其是在探索替代解决方案的昂贵时。由于专家意见可能会偏离,因此可以通过汇总独立判断来解决找到正确的替代方案的问题作为集体决策问题(CDM)。当前的最新方法集中于有效地找到最佳专家,因此如果所有专家均不合格或过于偏见,则表现不佳,从而可能破坏决策过程。在本文中,我们提出了一种基于上下文多臂匪徒问题(CMAB)的新算法方法,以识别和抵消这种偏见的专业知识。我们探索同质,异质和两极分化的专家小组,并表明这种方法能够有效利用集体专业知识,优于最先进的方法,尤其是当提供的专业知识质量降低时。我们的新型CMAB启发方法实现了更高的最终表现,并且在收敛的同时比以前的自适应算法更快。
translated by 谷歌翻译
We present NusaCrowd, a collaborative initiative to collect and unite existing resources for Indonesian languages, including opening access to previously non-public resources. Through this initiative, we have has brought together 137 datasets and 117 standardized data loaders. The quality of the datasets has been assessed manually and automatically, and their effectiveness has been demonstrated in multiple experiments. NusaCrowd's data collection enables the creation of the first zero-shot benchmarks for natural language understanding and generation in Indonesian and its local languages. Furthermore, NusaCrowd brings the creation of the first multilingual automatic speech recognition benchmark in Indonesian and its local languages. Our work is intended to help advance natural language processing research in under-represented languages.
translated by 谷歌翻译
We study a natural extension of classical empirical risk minimization, where the hypothesis space is a random subspace of a given space. In particular, we consider possibly data dependent subspaces spanned by a random subset of the data, recovering as a special case Nystrom approaches for kernel methods. Considering random subspaces naturally leads to computational savings, but the question is whether the corresponding learning accuracy is degraded. These statistical-computational tradeoffs have been recently explored for the least squares loss and self-concordant loss functions, such as the logistic loss. Here, we work to extend these results to convex Lipschitz loss functions, that might not be smooth, such as the hinge loss used in support vector machines. This unified analysis requires developing new proofs, that use different technical tools, such as sub-gaussian inputs, to achieve fast rates. Our main results show the existence of different settings, depending on how hard the learning problem is, for which computational efficiency can be improved with no loss in performance.
translated by 谷歌翻译
本文介绍了针对自闭症儿童的社会辅助机器人技术,旨在使用机器人疗法进行自闭症。该项目的目的是测试自闭症儿童与社会机器人NAO的互动。特别是机器人将在其工作中支持操作员(心理学家,教育者,言语治疗师等)。该项目的创新方面是,儿童机器人互动将考虑孩子的情绪和特定特征,机器人将相应地适应其行为。
translated by 谷歌翻译
深度学习体系结构的令人印象深刻的性能与模型复杂性的大量增加有关。需要对数百万个参数进行调整,并相应地进行训练和推理时间扩展。但是需要进行大规模的微调吗?在本文中,专注于图像分类,我们考虑了一种简单的转移学习方法利用预卷积特征作为快速内核方法的输入。我们将这种方法称为最佳调整,因为只有内核分类器经过培训。通过执行2500多个培训过程,我们表明这种最佳调整方法提供了可比的精度W.R.T.进行微调,训练时间较小在一个和两个数量级之间。这些结果表明,顶级调整为中小型数据集中的微调提供了有用的替代方法,尤其是在训练效率至关重要的情况下。
translated by 谷歌翻译
监测原位浮游生物的种群对于保留水生生态系统至关重要。浮游生物微生物实际上易受较小的环境扰动的影响,可以反映出随之而来的形态学和动力学修饰。如今,高级自动或半自动采集系统的可用性已允许生产越来越多的浮游生物图像数据。由于大量获得的数据和浮游生物的数字,因此,采用机器学习算法来对此类数据进行分类。为了应对这些挑战,我们提出了有效的无监督学习管道,以提供浮游生物微生物的准确分类。我们构建一组图像描述符,利用两步过程。首先,对预先训练的神经网络提取的功能进行了跨自动编码器(VAE)的培训。然后,我们将学习的潜在空间用作聚类的图像描述符。我们将方法与最新的无监督方法进行了比较,其中一组预定义的手工特征用于浮游生物图像的聚类。所提出的管道优于我们分析中包含的所有浮游生物数据集的基准算法,提供了更好的图像嵌入属性。
translated by 谷歌翻译
从物理的角度来看,深度神经网络是其“链接”和“顶点”迭代处理数据并以优选求解任务的图形。我们使用复杂的网络理论(CNT)作为定向的加权图代表深神网络(DNN):在此框架内,我们引入指标将DNN作为动力学系统,其粒度从重量到包括神经元在内的层延伸到层。CNT区分参数和神经元数量不同的网络,隐藏层和激活的类型以及客观任务。我们进一步表明,我们的指标会区分低性能网络。CNT是一种理论DNN的综合方法,也是解释模型行为的互补方法,该方法实际上是基于网络理论的,并且超越了研究良好的输入输出关系。
translated by 谷歌翻译
森林砍伐是导致气候变化的因素之一。气候变化对人类的生命有严重的影响,并且由于二氧化碳等温室气体的排放到大气中而发生。重要的是要了解缓解工作的森林砍伐原因,但是缺乏数据驱动的研究来预测这些森林砍伐驱动因素。在这项工作中,我们提出了一种称为多模式SuperCon的对比学习体系结构,用于使用从Landsat 8获得的卫星图像对印度尼西亚的森林砍伐进行分类。多模式SuperCon是一种结合了对比度学习和多模式融合以处理可用的Deforestation数据集的架构。我们提出的模型优于先前的驾驶员分类工作,与同一任务的最新旋转模型相比,准确性提高了7%。
translated by 谷歌翻译
对比学习是一种表示方法,该方法是通过将样品与其他类似样本进行对比,以使它们紧密地将其结合在一起,从而在特征空间中形成簇。学习过程通常是使用两阶段训练架构进行的,它利用对比度损失(CL)进行功能学习。对比度学习已被证明在处理不平衡数据集方面非常成功,其中某些课程的代表性过高,而另一些类的代表性不足。但是,以前的研究并未针对数据集进行不平衡的CL进行专门修改。在这项工作中,我们引入了一个不对称版本的Cl(称为ACL),以直接解决类不平衡问题。此外,我们提出了不对称的局灶性对比损失(AFCL)作为ACL和局灶性对比损失(FCL)的进一步概括。 FMNIST和ISIC 2018不平衡数据集的结果表明,AFCL能够以加权和未加权分类精度优于CL和FCL。在附录中,我们在熵上提供完整的公理处理以及完整的证明。
translated by 谷歌翻译
近年来,对图表的研究受到了极大的关注。但是,到目前为止,大多数研究都集中在单层图的嵌入上。涉及多层结构的表示问题问题的少数研究取决于以下强烈的假设:层间链接是已知的,这限制了可能的应用范围。在这里,我们提出了多层,这是允许嵌入多重网络的图形算法的概括。我们表明,多层能够重建层内和层间连接性,超过了图形,该图是为简单图形而设计的。接下来,通过全面的实验分析,我们还以简单和多重网络中的嵌入性能阐明,表明图的密度或链接的随机性都会强烈影响嵌入的质量。
translated by 谷歌翻译